Fouille d'opinion : ces mots qui changent de polarité selon le domaine

نویسنده

  • Morgane Marchand
چکیده

Sentiment is expressed differently in different domains. For instance, words which are used in both domains can change their polarity. In this article, we present a study on these multi-polarity words. We first show that these multi-polarity words are actually used by automatic opinion classifiers and affect their performances: the classification performance improves if the multi-polarity words are considered as two different words, or even suppressed from the representation. In a second part, we present an exploratory method for multi-polarity words detection without any labelled target data. This method relies on the comparison of the co-occurrence profiles of the words with a set of pivot words, selected to have only one polarity. MOTS-CLÉS : Fouille d’opinion, Adaptation au domaine, Changement de polarité

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Study of Domain Dependant Multi-Polarity Words for Document Level Opinion Mining (Influence des marqueurs multi-polaires dépendant du domaine pour la fouille d'opinion au niveau du texte) [in French]

Résumé. Les méthodes de détection automatique de l’opinion dans des textes s’appuient sur l’association d’une polarité d’opinion aux mots des textes, par lexique ou par apprentissage. Or, certains mots ont des polarités qui peuvent varier selon le domaine thématique du texte. Nous proposons dans cet article une étude des mots ou groupes de mots marqueurs d’opinion au niveau du texte et qui ont ...

متن کامل

Construction automatique de ressources lexicales pour la fouille d'opinion

RÉSUMÉ. De nombreuses méthodes automatiques de fouille d'opinion s'appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques, basées sur les similarités sémantiques entre les mots dont on veut estimer la pol...

متن کامل

Méta-apprentissage d'expériences Concepts, stratégies et perspectives

Résumé. Dans certains domaines de la vie économique, notamment dans le domaine de la santé, de nombreuses expériences réparties dans le temps et/ou dans l’espace traitent d’un même sujet et y apportent leur éclairage. De chaque expérience, on peut élaborer une prédiction, une connaissance selon différentes techniques d’apprentissage. La problématique de notre article vise à répondre à la questi...

متن کامل

Fouille de données datées hétérogènes optimisant les opérations et la maintenance de véhicules

L’exploitation et la mise à profit des données récupérées à partir de capteurs sont un sujet clef dans beaucoup de domaines d’application. La complexité réside autant dans le volume des flux d’information récupérés, que dans l’interprétation des données. Spécialement, dans le domaine de l’aéronautique, cette tâche est plus ardue vu la quantité des flux récupérés, la nature des données, la compl...

متن کامل

La génération des résumés visuels de flux de données de capteurs météorologiques avec des chorèmes

La géovisualisation est considérée comme un domaine de recherche en pleine expansion, elle utilise des outils intelligents qui peuvent aider à trouver "une aiguille dans une botte de foin", en s’appuyant sur des techniques pour filtrer les données pertinentes (Kraak, 2003). En outre, en ce qui concerne les données en temps réel provenant de capteurs, la complexité augmente davantage. Plusieurs ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013